#AI 初創公司
晶片初創公司,單挑輝達和博通
日前,一家名為Upscale AI的晶片初創公司宣佈。已完成 2 億美元的 A 輪融資,旨在挑戰輝達在機架級 AI 系統交換機領域的統治地位,與思科、博通和 AMD 等公司展開競爭。據該公司在新聞中介紹,本輪融資由Tiger Global、Premji Invest和Xora Innovation領投,Maverick Silicon、StepStone Group、Mayfield、Prosperity7 Ventures、Intel Capital和Qualcomm Ventures參投。此次融資使Upscale AI的總融資額超過3億美元。他們進一步指出,投資者的迅速湧入反映了行業日益增長的共識:網路是人工智慧擴展的關鍵瓶頸,而旨在連接通用計算和儲存的傳統網路架構從根本上來說並不適用於人工智慧時代。在他們看來,關鍵的區別在於:傳統網路連線的是終端節點,而人工智慧網路則統一整個叢集。隨著專用人工智慧計算的不斷擴展,它越來越受到改造或專有網路架構的限制。傳統的資料中心網路解決方案是為人工智慧出現之前的世界而設計的,而不是為機架級規模所需的大規模、高度同步的擴展而設計的。一個旨在撼動輝達護城河的團隊大家都知道輝達的GPU,但正如我們再很多報導中所說,這家巨頭在網路方面也表現很不錯。受人工智慧資料中心連接需求強勁的推動,輝達2026財年第三季度的網路業務收入同比增長162%,達到81.9億美元,這已經遠超他們當年收購Mellanox所耗費的資金。NVlink也成為了輝達當之無愧的護城河。考慮到當前單晶片性能擴展乏力,Scale Up和Scale Out的連接需求在未來很長一段時間必將成為主流。換而言之,如果能夠製造出高基數(即連接埠數量眾多)且連接埠間總頻寬高,足以與輝達NVSwitch記憶體架構和NVLink連接埠相媲美的UALink交換機的公司,必將大賺一筆。Upscale AI,就是一家抱著這個理想而成立的公司。而該公司的創始人Rajiv Khemani,則是行業中讓人如雷貫耳的連續晶片創業專家。據介紹,Rajiv Khemani曾擔任Sun Microsystems公司的高級產品經理,負責Sparc伺服器和Solaris作業系統。他還曾在NetApp和英特爾公司任職,負責多個業務部門的戰略和市場行銷。2003年,他出任晶片初創公司Cavium Networks的首席營運官。該公司成立於2000年,最初以生產MIPS處理器起家,但後來憑藉2014年推出的ThunderX伺服器CPU進軍Arm伺服器市場,並因此聲名鵲起。同年,Cavium收購了新興可程式設計交換機ASIC製造商XPliant。2016年6月,Cavium斥資13.6億美元收購了QLogic的儲存業務。2017年11月,晶片巨頭Marvell斥資60億美元收購Cavium,正式進軍資料中心領域。Khemani 於 2015 年離開 Cavium,成為 Innovium 的聯合創始人兼首席執行長。Innovium 是一家設計高頻寬、極簡主義超大規模乙太網路交換機 ASIC 的公司,其產品名為 TeraLynx。Marvell於 2021 年 8 月以 11 億美元收購了 Innovium ,以進一步推進其資料中心晶片的雄心壯志。到了2022年2月,Rajiv Khemani和Barun Kar創立了一家名為Auradine的公司,該公司致力於研發4奈米和3奈米製程的人工智慧和區塊鏈計算及網路晶片。Auradine在2024年之前完成了兩輪融資,共籌集了1.61億美元,並在2025年4月的B輪融資中又籌集了1.53億美元。到了2024年5月,Khemani和Kar決定將Auradine的部分網路業務剝離出來,成立一家名為Upscale AI的新公司,以便更直接地開拓預計到本十年末將達到1000億美元的人工智慧互連市場。在成立之初,該公司得了英特爾、AMD 和高通等公司的支援,值得一提的是,Kar是Auradine和Upscale AI的另一位聯合創始人,曾任Palo Alto Networks(一家防火牆和其他安全產品製造商)的工程高級副總裁兼創始團隊成員。在此之前,早在網際網路泡沫時期,Kar就曾擔任Juniper Networks的高級系統經理,負責管理其乙太網路路由器和交換機產品。Upscale AI表示,公司的策略是將 GPU、AI 加速器、記憶體、儲存和網路整合到一個單一的同步 AI 引擎中。作為 Upscale AI 戰略的核心要素,專為擴展而打造的 SkyHammer解決方案通過縮短加速器、記憶體和儲存之間的距離,實現了統一機架,並將整個堆疊轉換為一個統一的同步系統。Upscale 的 AI 平台基於開放標準和開源技術建構,並積極推進這些標準和開源技術的發展,包括 ESUN、Ultra Accelerator Link (UAL)、Ultra Ethernet (UEC)、SONiC 和交換機抽象介面 (SAI)。該公司積極參與 Ultra Accelerator Link 聯盟、Ultra Ethernet 聯盟、開放計算項目 (OCP) 和 SONiC 基金會。憑藉新增的 2 億美元融資,Upscale AI 將推出首個涵蓋晶片、系統和軟體的全端式交鑰匙平台,旨在連接未來通用人工智慧 (AGI) 的異構系統。一款專為網路而最佳化的晶片如上所述,人工智慧叢集由多個機架組成,每個機架可容納數十台伺服器。這些伺服器通過內建於主機機架中的交換機相互交換資料。機架交換機的技術特性通常與其他網路裝置(例如用於連接不同機架的裝置)的技術特性有顯著差異。而Upscale AI 正在開發的這款名為 SkyHammer 的產品是一款專為縱向擴展網路(即連接機架內部硬體元件)而最佳化的晶片,能提供確定性延遲。這意味著可以高精度地預測資料在機架元件之間傳輸所需的時間。眾所周知,人工智慧模型通過計算來處理資料,而這些計算必須按特定順序執行。因此,一次計算的延遲往往會導致後續所有處理步驟的延遲。提前預測網路延遲可以避免意外的資料傳輸延遲,從而防止人工智慧工作負載變慢。在接受Nextplatform採訪的時候,Upscale AI闡述了自己的目標:首先,如今,對於規模化 AI 網路而言,真正切實可行的選擇其實只有一個,那就是 NVSwitch。這也是輝達在 GenAI 浪潮中取得巨大成功的原因之一(當然還有其他原因)。而Upscale AI 希望為客戶提供更多選擇。“我一直堅信異構計算和異構網路是未來的發展方向,”Upscale AI高管告訴The Next Platform。“人們應該有自由選擇權,可以靈活組合各種資源,因為每個人都有其獨特之處,而這種組合方式能夠根據每個人的需求進行最佳化。有見及此,Upscale AI 致力於普及 AI 計算的網路,他們堅信異構計算的潛力。“我們認為輝達擁有卓越的技術,在創新方面也是一家傑出的公司。但展望未來,隨著 AI 創新的步伐不斷加快,我認為沒有任何一家公司能夠提供 AI 所需的所有技術——尤其是在未來發展趨勢方面。因此,這必然意味著不同供應商將提供不同類型的計算解決方案。”Upscale AI 強調。Upscale AI 同時認為,當少量 CPU 與少量 GPU 通訊,且 GPU 的相對記憶體頻寬較低,並且 CPU 和 GPU 在伺服器節點中緊密排列時,PCI-Express 交換機制能夠很好地工作。Upscale AI 於 2024 年初啟動時,UALink 聯盟和 Meta Platforms 提出的 ESUN 標準尚未成立,但異構基礎設施的概念早已存在,其目的並非僅僅是為了建構一套能夠完成所有任務的單一基礎設施,而是為了建構一套能夠更好地匹配不同任務工作流程的基礎設施。“未來,單個GPU可能無法完成所有計算任務,異構計算將會成為主流,”Upscale AI 方面解釋道。“某些CPU、GPU或XPU可能擅長預編碼和預填充,而其他裝置可能擅長解碼。但如果X廠商擅長預填充,Y廠商擅長解碼,又該怎麼辦呢?交換如今已成為這台機器的核心,它將所有這些功能連接起來,必須確保連接的公平性,並且還要具備可擴展性和可靠性。可靠性至關重要,因為你的任何操作都會直接影響系統中的所有計算。”在NextPlaform的採訪中,Upscale AI 對那些通過美化 PCI-Express 交換機 ASIC 或拆解乙太網路交換機 ASIC 來製造 UALink、ESUN 或 SUE 交換機的做法嗤之以鼻。“我看到的很多做法都像是對PCI-Express進行改造,也就是拿PCI-Express的基板來嘗試做其他事情,或者其他廠商拿乙太網路來嘗試改造。但整個記憶體領域的關鍵在於它無法改造。那樣做無法為客戶提供真正最佳化的、僅能向上擴展的堆疊,因為最終的結果只是拿一個基板,試圖移除不需要的東西。長期從事ASIC行業的人都知道,你可以移除很多模組,但基本單元仍然保持不變。每個ASIC都有其不變的基本DNA。”因此,Khemani 和 Kar 著手從頭開始建構一個記憶體結構 ASIC,專門用於此目的,然後確保它支援記憶體語義協議的更新。雖然並沒有披露AISC細節,但Upscale AI 表示,SkyHammer 將生成即時遙測資料。遙測資料,即關於系統的技術資料,不僅對故障排除至關重要,對配置任務也必不可少。管理員可以分析網路裝置的狀態遙測資料,從而找到最佳化其性能的方法。SkyHammer還相容多種開源網路技術,其中包括UALink和ESUN。這兩個項目都致力於利用乙太網路實現可擴展的網路應用場景。ESUN是其中較新的項目,於去年啟動,並獲得了輝達、博通和其他主要行業參與者的支援。SkyHammer還將支援一種名為UEC的網路技術。ESUN旨在連接機架內部的元件,而UEC則專注於連接不同的機架。它可以為多達100萬個晶片的AI叢集提供支援。“我們正在研發一種高基數交換機(high radix switch )和一款能夠實現這一切的專用積體電路(ASIC)。”Upscale AI強調。寫在最後NVLink 是輝達開發的一種高速互連技術,用於將記憶體和計算資源從多個 GPU 中抽象出來,使它們看起來像一個單一的邏輯資源。這項技術於2024年問世,此後,AMD和思科等公司一直在嘗試開發替代方案。但他們迄今為止的努力(例如UALink和ESUN),仍不成熟。AMD首批基於UALink的機架式系統將於今年晚些時候上市,但它們將通過乙太網路隧道傳輸該協議。能夠與Nvidia的NVSwitch競爭的專用UALink交換機目前尚未問世。Upscale的目標是通過其SkyHammer定製ASIC晶片改變這一現狀。Upscale AI 首席執行長 Barun Kar 告訴外媒El Reg:“我們不是在改造傳統系統,而是在重新構想 AI 網路中規模的真正含義。”“這種架構的核心本質上是為了擴展規模。它是專門為人工智慧工作負載而設計的,不適用於其他任何用途。”雖然我們沒有足夠的資訊將這款晶片與 NVSwitch 6 或 Broadcom 的 Tomahawk 6 進行比較,但 Kar 告訴我們,它採用了基於記憶體語義的載入-儲存網路架構,並將具有類似於 Nvidia Sharp 的集體通訊加速功能。該平台還將同時支援 UALink 和與其競爭的 ESUN 協議。為了使整個系統能夠大規模管理,Upscale 正在努力擴展對 SONiC 網路作業系統 (NOS) 的支援。SONiC 是一款開源 NOS,最初由微軟開發,已被廣泛部署,並深受超大規模客戶的青睞。目前,Upscale 主要專注於縱向擴展網路產品,但長期來看,計畫將產品線擴展到更傳統的橫向擴展交換機。Kar 告訴我們,為此,公司仍在評估各種方案,並可能借助合作夥伴的第三方智慧財產權。“我們已經與超大規模資料中心營運商和GPU供應商建立了合作關係,他們已經驗證了該架構。這部分工作已經完成。現在,這筆資金的重點是將創新轉化為實際部署,”Kar說道Upscale AI執行董事長Rajiv Khemani也表示:“Upscale AI在極短的時間內就取得了非凡的發展勢頭。市場需要開放、可擴展的AI網路解決方案,而Upscale AI憑藉其獨特的優勢,能夠幫助客戶突破當前網路方面的限制。” (半導體行業觀察)
從Google投資Anthropic案例思考AI投資的非排他性
今年三季度Google的財報中,投資收益引人注目,前三季度的浮盈已經達到220億。Google的這類非市場化股權投資通常與其戰略需求,或對其生態系統至關重要的AI 初創公司投資有關。今年的盈利主要來源於對Anthropic的投資。Anthropic是目前全球估值最高的未公開上市AI 公司之一。相比其它股東,Google投資金額較小,但入局早。從Anthropic的籌資歷史與估值變化中,可以看到其受到了資金的極度追捧。2021-2022,早期投資5.8億,來自於現在已經破產的FTX。2023年9月-2024年11月,亞馬遜承諾投資40 億美元。2023年10月,Google承諾投資20億。2024年3月,由 Lightspeed 領投E輪,籌資27.5億,估值達到615 億美元.2025年8月,由ICONIQ Capital 領投,籌資130億,估值達到 1830 億美元。2025年11月,微軟和輝達聯合投資150億。微軟約 50 億美元,輝達約 100 億美元。估值猛增至約 3500 億美元,是Google投資時的87倍!Anthropic是由前OpenAI 的核心研究人員在2021年創立的。其Claude 系列大型語言模型是當前市場上唯一能在性能上與ChatGPT 和Gemini抗衡的頂級模型。Claude與其它模型的不同之處,在於其專注於那些能在近期產生經濟效益的,企業級市場,模型的程式設計能力尤其強大。它對Google的DeepMind和 OpenAI關注的數學推理等領域則投入較少。可以看到,科技公司們正在根據自身技術稟賦和戰略目標,來選擇最能實現商業變現的細分領域進行深度挖掘。市場足夠大,容得下差異化競爭。2024年3月,Anthropic的E輪融資估值為615億美元。一年半後的2025年8月F輪融資,估值為1830億美元。這給Google和亞馬遜帶來巨大的帳面收益。短短兩個月後的11月,微軟和輝達也投資入股,估值幾乎翻倍,達到3500億美元。這說明Google的第四季度將同樣獲得可觀的帳面股權投資收益。Google和亞馬遜投資的主要目的之一是確保Anthropic 在其 AI 模型開發和訓練中,使用自己的雲服務。Google雲在與 Anthropic 簽訂的價值高達數百億美元的合同中,承諾提供大規模的Google自研的TPU AI 晶片,為其提供超過千兆瓦的計算能力,用於模型訓練和擴展。通過融資,Anthropic巧妙地鞏固了所有主要雲服務提供商和輝達的算力支援。從這個案例中可以看到,這些科技巨頭之間的關係錯綜複雜,Anthropic與它的股東們的關係既競爭又合作,還互相投資。比如Gemini 是Claude在產品和技術上的主要對手,而Google雲又提供了Anthropic關鍵的基礎設施。這樣的關聯交易就是大空頭Micheal Burry認為AI有泡沫的依據之一。非排他性值得注意的是,所有這些股權投資和業務上的合約都沒有排他性條款。比如,Google和亞馬遜在投資Anthropic的時候,並不限制Anthropic使用對方的雲。類似的,輝達投資OpenAI時,也不限制OpenAI買別家的晶片。在傳統行業,排他性競爭是主流。股權投資經常作為換取稀缺實物資源,比如礦產,的長期獨家控制權的籌碼。這是因為,傳統行業的市場規模增長速度通常與經濟增長速度持平或略高,是線性增長。在有限的市場中,競爭必然是排他性的。企業會通過法律合同、獨家供應協議、收購競爭對手等方式來消除競爭,實現市場份額最大化和垂直整合。而AI領域的技術和市場特徵與傳統行業截然不同。首先,AI創造了全新的、指數增長的需求,尤其是在算力和應用領域。ai技術的複雜性與垂直整合難度,意味著沒有一家企業能從底層晶片、中介軟體、基礎模型、到應用層都做到最好。每一家都可以在自己擅長的領域發展,而不威脅到競爭對手。比如,Google的TPU晶片即使開始對外銷售,擴大市場份額,也不會影響輝達GPU的需求量。因為兩者服務的是不同的需求對象,而且對兩者的需求都遠大於供應。在市場巨大、資源稀缺、技術複雜這些因素的作用下,合作比排他性競爭能帶來更高的回報。AI巨頭們對前沿公司,如Anthropic、OpenAI的投資,能獲得技術,商業機會和投資回報等多重收益:通過鎖定技術和人才來對衝落後的風險。投資競爭對手的模型可以讓雲巨頭們獲得對最新AI 技術、能力和人才的近距離觀察,有助於他們縮小自身模型的差距。股權合作可以確保最新的頂尖模型優先部署在自己的雲服務上。Anthropic授權Google雲和亞馬遜雲AWS,將 Claude模型整合到Google雲的AI 服務生態Vertex AI和亞馬遜的AI 模型服務平台Amazon Bedrock 上。這允許Google雲和AWS的使用者通過 API 介面,直接在兩者的環境中呼叫 Claude用於建構自己的應用。使用者使用 Claude 模型時,Google雲和AWS會向 Anthropic 支付授權費用。由此,Google和亞馬遜成為Anthropic的戰略合作夥伴和分銷商,而不僅僅是算力供應商。這是AI時代基礎設施與模型技術深度繫結的競合模式。自然而然地,Anthropic盈利能力的提升,推動估值,也會給Google和亞馬遜帶來巨大的投資回報。從Anthropic的角度來看,則獲得了將計算資源進行最優配置的能力。它同時獲得Google的 TPU,亞馬遜的 Trainium/ Inferentia,以及微軟的 Azure的基礎設施支援,可以確保最先進的模型可以運行在最適合它們的硬體上,最大化技術產出。社會意義這些非排他性的投資與合作,還會產生一個更宏大、更具社會意義的結果。那就是促進整個AI行業的技術進步、擴大其社會應用範圍,進而激發全社會對AI的接受度和需求。首先,非排他性能更好地支援分散式創新,更有可能突破技術瓶頸,達到效率的極致化。Anthropic專注於 AI 安全和編碼,OpenAI 專注於通用智能,DeepMind 專注於科學發現。這種多點開花的競爭模式比任何一家公司內部研發都更有效率。巨頭們通過非排他性投資,可以外包一部分前沿研究的風險和成本,同時受益於所有方向的突破。其次,當市場上多個優秀且可信賴的AI 產品(Claude, ChatGPT, Gemini)出現時,企業和公眾對AI 技術的接受度會更快、更廣泛。當前這波由生成式AI 驅動的社會接受速度,在科技史上是前所未有的。參考歷史上,新技術達到1億使用者所需的時間,固定電話用了75年,手機16年,網際網路7年,臉書4.5年,而ChatGPT才僅僅用了2個月。如果用技術採納生命周期來衡量,AI目前正處於從早期採納,向加速滲透過渡的關鍵時期。在個人層面,已經超過數億人在使用AI 進行寫作輔助、程式碼查詢、資訊總結、日程規劃和創意生成。Google的生成式搜尋體驗和微軟的Copilot,正在將 AI 回答直接整合到搜尋結果中,這意味著每一次搜尋都在使用 AI。新一代智慧型手機、電腦作業系統正在將大語言模型作為底層能力內建,使用者在不知不覺中已經在使用AI。企業也已經認識到AI 不是可選項,而是保持競爭力是必須項,正在重金投資部署。Microsoft Copilot、GitHub Copilot 等工具被大規模採購,用於提升知識工作者和程式設計師的效率。企業正在將AI 模型,如Anthropic 的 Claude 或 Gemini,作為新的 API 介面整合到其核心業務系統和軟體中,實現資料分析和決策的自動化。未來當AI模型更加安全、專業和可信賴,垂直領域的關鍵應用也被成功開發和部署後,AI 會真正嵌入到各個傳統行業中,真正提升實體行業在物理世界的生產力。那時,AI 的廣泛應用將創造出目前我們無法想像的新商業模式和工作流程,這反過來會產生對大規模、持續、複雜算力的巨大需求。最終回到巨頭們投資的核心收益:建立未來的盈利基礎。算力消耗本質上是技術被社會接受度提高的最終結果。因為如果AI 不能廣泛應用於社會並改變生產力,那麼對算力的需求就會停滯不前。通過非排他性協議,讓被投資企業取得成功,從而最大程度地激發整個AI 生態系統的繁榮,最終將推動底層基礎設施和巨頭們自身產品的需求。 (一顆南瓜籽的成長)
挑戰國際巨頭,中國初創公司發佈新一代AI訓練晶片
一家由中國科技企業家創立的美國初創公司Enther AI,近日正式發佈了其首款自研AI訓練晶片——Enther TPU。據公司宣稱,該晶片在運行特定AI模型時,其速度可達輝達2020年發佈的A100 GPU的1.5倍,能效提升42%。Enther AI由前Google工程師郭志雄(Zhixiong Guo)於2023年創立。公司在推出Enther TPU的同時,也展示了整合該晶片的E1伺服器節點。每個E1節點搭載4顆Enther TPU,可提供高達10.8 petaFLOPS的BF16訓練算力。Enther AI進一步提出了建構萬卡叢集的藍圖,其設計的“E1超級叢集” 通過光學電路切換網路連線多達2500個E1節點(即10,000顆TPU),旨在為兆參數大模型提供訓練支援。值得注意的是,儘管Enther AI總部位於美國,但其研發活動具有鮮明的跨太平洋特徵。公司的研發團隊主要在中國,這使其發展路徑和動向備受業界關注。在軟體生態方面,Enther AI推出了E-SDK,聲稱其能“無縫”將基於NVIDIA GPU的AI訓練項目遷移至其Enther TPU平台上,並支援PyTorch、JAX等主流AI框架。不過,目前該晶片的公開性能資料均來自Enther AI自身的測試報告,尚未有第三方機構的獨立驗證。此外,Enther TPU作為市場新入者,其實際量產交付能力、在更廣泛AI工作負載下的穩定性以及能否成功建構起持續的開發者生態,仍是其未來需要面對的關鍵挑戰。在全球AI算力競爭日益激烈的背景下,Enther AI的亮相為市場帶來了新的選擇。然而,從技術發佈到獲得產業界的廣泛認可和採用,這家年輕的初創公司仍有很長的路要走。其後續發展,特別是產品的實際應用表現,將成為衡量其成功與否的真正試金石。 (晶片行業)
輝達對他忍不住了
“我們注意到,晶片走私嘗試已變得日益複雜,包括通過空殼公司、偽裝運輸(如假孕肚或龍蝦包裝)等荒誕手段。BIS應投資於先進檢測技術,如AI驅動的供應鏈分析,以識別和攔截此類行為。……AI正在重塑全球經濟和地緣政治格局。美國在算力基礎設施和AI模型開發上的領先地位是其國家安全和經濟競爭力的基石。然而,外國實體——包括潛在對手——正通過合法和非法手段尋求獲取這些技術。”2025年5月3日,輝達對美國人工智慧初創公司Anthropic發出激烈批評。此前,Anthropic公開支援美國政府的《人工智慧擴散出口管制框架》,主張加強對中國的AI晶片出口限制,上面這段話就來自Anthropic的公開聲明。輝達對此的回應聲明毫不留情:“中國擁有全球一半的AI研究人員,在AI技術堆疊的每一層都有頂尖專家。美國無法通過操縱監管機構在AI領域取勝。美國企業應專注於創新與迎接挑戰,而不是編造荒誕不經的謠言。”這場爭端再次暴露了Anthropic在中美AI博弈中赤裸裸的立場,也將這家由前OpenAI研究人員創立的公司推上了風口浪尖。要理解Anthropic的動機,我們需要回溯它的成長軌跡,剖析其創始人——尤其是達里奧·阿莫迪(Dario Amodei)的理念,才能透過他大放厥詞背後的傲慢與偏見,窺探中美AI競爭的未來走向。Anthropic的起點是2021年,一群對OpenAI商業化方向不滿的研究人員選擇另起爐灶。達里奧·阿莫迪和他的姐姐丹妮拉·阿莫迪領銜創立了這家公司,團隊還包括賈裡德·卡普蘭(Jared Kaplan)和政策專家傑克·克拉克(Jack Clark)等人。他們有一個共同的信念:人工智慧的潛力巨大,但若不加以約束,可能帶來災難性後果。Anthropic註冊為公共利益公司(Public Benefit Corporation),承諾開發“負責任”的AI,造福人類長遠利益。達里奧,這位曾少年時期便在伯克利修讀數學課程的天才,喜歡在公司白板上勾畫AI智能增長的曲線,也熱衷於通過“願景探索”激發靈感。丹妮拉則帶來了文學背景的人文視角,試圖打造一個低自我、高信任的團隊文化。這支深受有效利他主義哲學影響的團隊,不僅開發AI技術,更把思考AI對人類社會的深遠影響作為使命。2023年,Anthropic推出了Claude系列大語言模型,直接挑戰OpenAI的ChatGPT。Claude的獨特之處在於其“憲法AI”框架,通過內建倫理準則確保輸出的安全性與價值一致性。這一創新讓Anthropic迅速嶄露頭角。早期,Anthropic獲得58億美元融資,包括來自FTX的5億美元。儘管FTX後來的崩盤令人唏噓,但Anthropic的資金鏈並未受阻——亞馬遜投入125億美元(計畫總計400億),Google追加50億美元(承諾再增150億)。這些資源推動了Anthropic的技術飛躍。2024年,Claude 3系列(Haiku、Sonnet、Opus)在多項基準測試中超越對手;同年6月,Claude 3.5 Sonnet發佈,新增即時程式碼預覽功能,進一步鞏固了其市場地位。Anthropic不僅在技術上與巨頭抗衡,還通過獨特的公司治理結構——長期利益信託(Long-Term Benefit Trust)——確保商業利益不凌駕於公共福祉之上。到2025年11月,這一信託將掌控董事會多數席位,以彰顯Anthropic對使命的執著。然而,Anthropic的野心遠不止技術突破。它的創始人將AI視為地緣政治的角力場,關乎民主與威權價值觀的較量。這種信念在Anthropic支援美國晶片出口管制時表現得淋漓盡致。達里奧在《論DeepSeek與出口管制》(On DeepSeek and Export Controls)一文中寫道:“出口管制並非為了規避競爭,而是為了確保民主國家在AI發展中保持領先,以捍衛自由與透明的價值觀”。他特別提到中國的DeepSeek公司,其R1和V3模型以低成本和高性能挑戰西方AI。儘管DeepSeek在程式碼生成和對話細膩度上稍遜一籌,但其開源模式和價格優勢讓達里奧感到不安。他指出:“中國在低成本基礎設施上的AI擴展能力令人敬畏,但出口管制有效限制了他們獲取尖端晶片的管道,為美國保留了關鍵優勢”。在達里奧看來,限制中國獲取先進晶片和模型權重,不僅能減緩其技術進步,還能防止“AI被用於生成生物武器資訊或破壞民主價值觀”。這一立場激怒了輝達。作為全球AI晶片的龍頭,輝達依賴包括中國在內的廣闊市場。Anthropic關於晶片走私的描述如“藏在假孕肚或龍蝦中”顯然含沙射影,被輝達斥為“荒誕不經”。輝達認為,中國的AI人才(佔全球47%)和技術實力意味著監管無法完全遏制其發展,過度管制反而可能削弱美國企業的全球競爭力。這場爭執也讓我們看到了美國AI產業鏈的內部分歧:晶片供應商如輝達重視市場開放,而模型開發者如Anthropic更擔憂技術擴散的風險。值得注意的是,Anthropic與亞馬遜的深度合作使其更多依賴後者的Trainium晶片,而非輝達的GPU,這或許讓它在面對輝達的批評時更有底氣。Anthropic為何如此堅定地支援出口管制?從戰略上看,這家年輕的AI公司面臨OpenAI和Google的巨大壓力。中國的DeepSeek等企業若憑藉低成本模型席捲市場,Anthropic的生存空間將被壓縮。通過支援管制,Anthropic得以延緩中國競爭者的步伐,為自身爭取發展時間。但戰略考量只是冰山一角。達里奧的文章揭示了更深層的意識形態驅動。他將中美AI競爭框定為“民主AI”與“威權AI”的對決,警告中國模型可能因倫理標準不同而生成“非法或有害內容”。他寫道:“如果我們失去領先地位,AI可能被用來放大控制而非自由”。這種信念與Anthropic自認為關注倫理與公共利益定位一脈相承,也可能是在川普政府上台後尋求政策支援的策略,以提升其在華盛頓的影響力。當前,中美AI競爭呈現出複雜的圖景。美國目前佔據優勢——其企業掌控先進晶片、龐巨量資料中心和前沿模型,但中國正在迎頭趕上。DeepSeek R1、Qwen2.5、Doubao-1.5-Pro、GLM-4-Plus和Yi-1.5等一系列模型在開源排行榜名列前茅,華為的昇騰晶片也初步顯示出自立能力。出口管制即使短期內奏效,但長遠來看,只會加速中國自主研發。輝達預計其H20晶片因出口管制損失55億美元,這正是出口管制對美國企業的經濟代價。達里奧也意識到了這一點,他對此則表示:“管制必須精準,以免激發中國繞過的決心”。但他仍堅持,出口管制是防止AI濫用的必要手段,並強調尤其是在生物武器或大規模監控等風險上。Anthropic試圖將AI競爭框定為“民主與威權”的對決,實則掩蓋了其背後的戰略焦慮和技術保護主義。這種立場不僅缺乏事實依據,還低估了中國AI生態的韌性和全球技術合作的不可逆趨勢。Anthropic對DeepSeek等中國AI企業的技術評估同樣充滿偏見。達里奧在文章中承認DeepSeek V3模型在性能上“接近美國最先進模型”,卻試圖通過強調其成本符合行業趨勢來淡化其創新意義。這一論調忽略了中國在算力最佳化和工程效率上的突破。例如,DeepSeek通過混合專家模型(MoE)和高效鍵值快取技術,以較低成本實現了高性能,訓練費用僅為Claude 3.5 Sonnet的十分之一。這種效率優勢並非“行業常態”,而是中國AI企業長期深耕演算法和基礎設施的結果。達里奧所謂“中國依賴非官方管道獲取晶片”的指控,更是缺乏證據,試圖將中國的技術進步歸因於“走私”而非自主創新。中國算力自給率和國產晶片在AI訓練中的應用佔比已經顯著提高,Anthropic的這種說辭,實質是掩飾其對美國AI企業成本高企、技術迭代放緩的擔憂。Anthropic支援的出口管制戰略,從長遠看將適得其反。達里奧聲稱管制是“確保民主國家領先”的必要手段,但這種單邊主義思維低估了中國AI生態的全球影響力。中國開源模型如DeepSeek V3,不僅在性能上媲美西方,還以低門檻和高可訪問性贏得開發中國家的青睞。相比之下,Anthropic的Claude模型因高昂的訂閱費用和封閉的生態,難以在全球市場普及。而Anthropic將AI競爭框定為“民主與威權”的意識形態對決,是一種充滿偏見的誤導。2024年,美國某主流模型被曝因缺乏有效過濾,生成大量種族歧視內容,引發廣泛爭議。最重要的是,Anthropic將AI競爭框定為“民主與威權”的意識形態對決,是一種充滿偏見的誤導。達里奧警告中國AI模型如DeepSeek可能因開源設計生成“有害內容”,卻忽視美國AI模型在偏見和倫理上的問題。研究表明,某些西方模型在微調時可能生成反人類內容,包括種族主義觀點,顯然,安全機制的侷限性與開發者的意識形態無關。Anthropic的“憲法AI”雖強調安全性,但其倫理標準深受西方價值觀影響,同樣被批評缺乏對非西方文化的適應性。新加坡AI產品高級總監Leslie Teo博士在推出面向東南亞語言的大型語言模型(LLM)SEA-LION時表示:“西方的大型語言模型帶有非常明顯的美國西海岸偏見——它們非常‘覺醒’(woke)。”而DeepSeek通過多語言支援和低成本API,在東南亞和非洲市場廣受歡迎。達里奧所謂“威權AI”的指控是對非西方技術路徑的污名化,試圖以意識形態標籤掩蓋美國在全球AI治理中的霸權意圖。中國始終倡導AI發展的普惠性,2023年提出《全球人工智慧治理倡議》,2024年通過聯合國和金磚國家峰會等平台推動技術共享與多邊合作,獲得多個開發中國家的支援。相比之下,Anthropic支援的出口管制政策將加劇全球AI生態的碎片化,阻礙知識共享,違背技術造福人類的初衷。 (心智觀察所)